b Beschrijvende statistiek 


Voorkennis Statistiek 


Bladzijde 8 

1) Als je kijkt naar de hoogtetoename van de staven dan lijkt er sprake te zijn van een afvlakking: de 
hoogtetoename van de derde naar de vierde en van de vierde naar de vijfde staaf is immers lang niet zo 
groot als die van de eerste naar de tweede en van de tweede naar de derde staaf. 
Tussen de eerste drie staven zit echter telkens vier jaar, terwijl daarna de staven per jaar gaan. Je mag ze 
daarom niet zo maar vergelijken. 


Bladzijde 9 
@ a De Telegraaf heeft 560 duizend abonnees en de Volkskrant heeft 230 duizend abonnees. 
Dus De Telegraaf heeft Dr =2,4 keer zoveel. 
b De Telegraaf heeft 560 duizend abonnees. 
Samen hebben de Volkskrant, NRC en Trouw 230 + 190 + 110 = 530 duizend abonnees. 


Dat is Ace E90 x100% = 5,7% meer. 
530 
(3) a In 2004 was de omzet 420 miljoen en in 2014 was de omzet 180 miljoen. 
De procentuele verandering is en x 100% =-57,1%. 
Dus een afname van 57,1%. 
Bed : 280 — 420 
b De procentuele verandering in de periode 2004-2008 bedroeg 0 x 100% =-33,3%. 
De procentuele verandering in de periode 2008-2014 bedroeg En x 100% =-35,7%. 


Dus in de periode 2008-2014 is de omzet procentueel het meest afgenomen. 


o a De stip van 2014 ligt vier keer zo hoog als de stip van 2008. 
8380 {00% = 3,8%. 


b De toename is 


c Er had een scheurlijn op de verticale as gebruikt moeten worden. 


Bladzijde 10 
(5) a 8% heeft bloedgroep B, dus je verwacht 0,08 - 250 = 20 mensen met bloedgroep B. 
b Sector A heeft 42%. 
Dus 0,42 x 360° =151°. 


6} a Het is vaak minder nauwkeurig omdat het vereenvoudigd is. 
b 15% komt overeen met 16,5 miljoen. 
0,1 
c Italië heeft 0,40 - 24,6 = 9,84 miljoen vakbondsleden. 
Duitsland heeft 0,30: 37,6 = 11,28 miljoen vakbondsleden. 


. … 11,28 9,84 
Dus Duitsland heeft de meeste vakbondsleden, namelijk — 084 


Dus totale beroepsbevolking = 5 110 miljoen. 


x 100% = 14,6% meer dan Italië. 


E a De lengte (en de breedte) van het biljet bij 2014 is vier keer zo groot als bij het biljet van 2013. 
b De oppervlakte van het biljet bij 2014 is 16 keer zo groot als bij het biljet van 2013. Daardoor lijkt 
het of de winst 16 keer zo groot is. 
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Bladzijde 11 
8} a De relatieve frequentie van bloedgroep A is oe x 100% = 42,9%. 
b Bij de drie leerlingen met bloedgroep B hoort 15%. 
Dus DE = 20 leerlingen in totaal. 
c Bij de 48 000 Surinamers hoort 9,4%. 


… 48000 
Dus het aantal inwoners is 0,094 511000. 


Bladzijde 13 
OQ a De totale frequentie is 3+3 +7 +0 +3 +2 + 2=20, dus het onderzoek duurde 20 dagen. 
+ 
b gemiddelde” ANR ES BETE K 6 555 
10° getal + 11° getal 2+2 
2 4 
modus = 2, want 2 heeft de grootste frequentie. 


mediaan = =2 


@Q a totale frequentie -2+44+5+34+3+241=20 
4AxIt+5Sx24+3x34Ixdt2IxStix32 


gemiddelde = 20 =3,85 
B 10° getal + 11° getal 2+2 
mediaan = = =2 
2 2 
modus = 2 


b De klas wijst op de mediaan die voor beide klassen gelijk is. 
c Het gemiddelde is gevoelig voor uitschieters, mediaan en modus zijn dat niet. 


5.1 Frequentieverdelingen 
Bladzijde 14 


@ a Er zijn 6 leerlingen met 2 broers of zussen. 
b Elke leerling is ondervraagd, dus 5+12+6+2+2+1=28 leerlingen. 


c De relatieve frequentie is En x 100% = 42,9%. 


3 4 5 6 


aantal 


Bladzijde 15 
A KASSA'S PER WINKEL 
frequentie 


8 


jen] —& Led u Ee Sal 
hed 
+ 
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b De totale frequentieis3 +7 +6 +4+6+2=28. KASSA'S PER WINKEL 


fi tie 
enen ie 100% en 


relatieve frequentie 


relatieve frequentie = 


relatieve 
aantal S 25% 
frequentie 


20% 


15% 


14,3% 


10% 


5% 


aantal 


c Er zijn 10 winkels met minder dan drie kassa’s. 
Dus De x 100% = 35,7% van de winkels heeft minder dan drie kassa’s. 
Er zijn 25 winkels met minstens twee kassa’s. 


Dus En x 100% = 89,3% van de winkels heeft minstens twee kassa’s. 


© a Oppervlakte bosperceel is 5 + 10 + 16 + 18 + 14 +7 +4 =74 are. 
b Het totale aantal bomen is 5 X1 +10 Xx2+16*3+I8Xx4+I4X5+HT7Xx6+4X7=285. 


BOMEN BOSPERCEEL 
relatieve frequentie 
0 


aantal 
bomen 
per are 


relatieve 
frequentie 


frequentie 


aantal per are 
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@ a Het aantal adressen is 148 + 126 +48 + 36 + 42 + 26 = 426. 


b : POSTSTUKKEN PER ADRES 
relatieve ‚ 
aantal relatieve frequentie 
frequentie 40% 
35% 
30% 
25% 
20% 
15% 
10% 
5% 
0, 
si 0 1 2 3 4 5 6 


aantal 


e Minder dan drie poststukken bij 148 + 126 + 48 = 322 adressen. 
Dat is Ee x 100% = 75,6% van de adressen. 


d Aantal = 126 *1+48Xx2+36x3+42 x4 +26 Xx 5628. 
(5) Het geeft geen beter overzicht, want elk waarnemingsgetal heeft frequentie 1. 


Bladzijde 17 
6} à WERKNEMERS PER WINKEL 


aantal frequentie 


30 <35 l 
b WERKNEMERS PER WINKEL 
frequentie 
12 
10 
8 
6 
4 
2 
0 
0 5 10 15 20 25 30 35 


aantal 
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C VLOEROPPERVLAKTE 


150 —< 250 
250 —< 350 
350 —< 450 
450 —< 550 
550 —< 650 


d _ VLOEROPPERVLAKTE 


frequentie 


14 


@ « Het aantal 16 komt 2 keer voor. 
b Het kleinste aantal is 3 werknemers. 
c Het aantal 8 komt het vaakst voor. 


d De klassen zijn 0 —< 10, 10 —< 20, 20 —< 30 en 30 —< 40. 


Bladzijde 18 


8} a Tellen geeft 16 mannen en 16 vrouwen. Dus 16 echtparen. 
b Er was 1 man van 33 jaar en 2 vrouwen waren 35 jaar oud. 
e Aantal personen van 40 jaar of ouder is 3 +2 +6 =11. 


d Aantal mannen jonger dan 30 jaar is 1 + 5 =6. 
Aantal vrouwen jonger dan 30 jaar is 4 +4 = 8. 


Bladzijde 19 
O 2 ARTIKELEN PER KLANT 
cumulatieve 
aantal ‚ 
frequentie 
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b ARTIKELEN PER KLANT 


cumulatieve frequentie 


90 
80 


70 
60 


50 


40 


0 10 20 30 40 50 60 
aantal 


ce 44 klanten kochten minder dan 30 artikelen. 
d 7 +5=12 klanten kochten minstens 40 artikelen. 


® a BEVOLKINGSONDERZOEK VROUWEN 


: relatieve 
: 8 cumulatieve 5 
lengte in em frequentie f cumulatieve 
frequentie . 
frequentie 


155 —< 160 
160 —< 165 
165 —< 170 
170 —< 175 
175 —< 180 
180 —< 185 


b BEVOLKINGSONDERZOEK VROUWEN 
relatieve cumulatieve frequentie 
100% 
80% 
60% 
40% 
20% 
0 
155 160 165 170 175 180 185 
lengte in em 
Bladzijde 20 
GEWICHT EIEREN 
' cumulatieve 
gram frequentie 


frequentie 
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GEWICHT EIEREN 
â cumulatieve frequentie 
5 


40 
30 
20 
10 
0 
60 63 66 69 72 75 
gram 


Beschrijvende statistiek 


(12) De frequentie die je bij de rechtergrens afleest heeft dan de betekenis ‘aantal met deze waarde of lager’. 
Zie bijvoorbeeld de polygoon in opgave 11. In de klasse 60 —< 63 zitten 8 eieren. De waarnemingen in 
deze klasse liggen verspreid tussen 60 en 63 gram. Als het punt bij het klassenmidden 61,5 uitgezet zou zijn, 
zou het net lijken of alte 8 eieren minder dan 61,5 gram zouden wegen. 


® a 
b 


Lees af: 80 leerlingen. 
Lees af: 60 leerlingen. 
Lees af: 40 leerlingen. 


d 70 — 60 = 10 leerlingen 


e 


afstand inkm | frequentie AFSTAND HUIS-SCHOOL 
frequentie 


45 


40 


35 


30 


25 


20 


Lees af: minder dan 100 seconden geeft 60%. 

Dat zijn 0,60 - 300 = 180 klanten. 

Lees af: minder dan 200 seconden geeft 85%. 

Dus 0,85 - 300 = 255 klanten. 

2,5 minuut = 150 seconden 

Lees af: minstens 150 seconden geeft: 100 — 70 = 30%. 

Dus 0,30 - 300 = 90 klanten. 

Lees af: minstens 100 seconden, maar minder dan 200 seconden geeft 85 — 60 = 25%. 
Dus 0,25 - 300 = 75 klanten. 

WACHTTIJD BĲ KASSA 


aantal seconden | frequentie 


50 —< 100 
100 —< 150 
150 —< 200 
200 —< 250 
250 —< 300 
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Bladzijde 21 
® a Van 10:00 uur tot 20:00 uur is 10- 4 = 40 kwartieren. 
b Lees bij 20 klanten af 80%. 
Dus 0,80 - 40 = 32 kwartieren. 
c Lees bij 15 klanten af 40%. 
Dus 40% van de kwartieren kwamen minder dan 15 klanten. Dan kwamen er dus 
100% — 40% = 60% van de kwartieren minstens 15 klanten binnen. 
Dat zijn 0,60 : 40 = 24 kwartieren. 


® a Van 8:00 tot 20:00 uur is 12 uur. 
Vijf dagen, dus het is gedurende 5 + 12 = 60 uur bijgehouden. 
Lees af: A en 30 klanten geeft 50%. 
Dus 0,50 * 60 uur = 30 uur. 
b Lees af: Ben 40 klanten geeft 20%. 
Dus minstens 40 klanten is 80%. 
Dat is 0,80 - 60 = 48 uur. 
c Lees af: B en 50 klanten geeft 30%. 
30% van 5 dagen is 1,5 dagen. 
Het kan dus hooguit 1,5 dag geweest zijn. 
d Dat is niet waar. Dat de grafiek bij B minder snel stijgt op het begin betekent dat een klein 
percentage van de uren er weinig klanten waren. Het kwam bij B dus vaker voor dat er veel mensen 
tankten. 


(17) a «© Lees bij Len 50 kg af 40%. Dus 0,40 : 200 = 80 bomen. 
e Lees bij ll en 60 kg af 25%. Dus 0,75 : 160 = 120 bomen. 
* Lees bij Len 50 kg af 40% en bij 70 kg 60%. Dus 60% — 40% = 20% en 0,20 - 200 = 40 bomen. 

b Perceel IL. Omdat de grafiek daar op het einde het meest toeneemt zie je dat bij de hogere opbrengsten 
de grootste percentages horen. 

C_OPBRENGST PERCEEL 1 


relatieve cumulatieve 
frequentie 


relatieve frequentie 


OPBRENGST PERCEEL | 
relatieve frequentie 


40% 


30% 


20% 


10% 


0% 
40 50 60 70 80 90 
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5.2 Centrummaten en variabelen 


Bladzijde 23 
(18) a Nee, daarvoor moet je de metingen kunnen optellen en delen. Je hebt daarvoor getallen nodig. 
Wat is immers het gemiddelde van bijvoorbeeld fiets en bus? Dat heeft geen betekenis, 
b De modus kan wel, dat is hier de bus. 


Bladzijde 24 
® a Mediaan, vanwege de uitschieter. 
b Modus, kwalitatieve gegevens. 
e Gemiddelde of mediaan. 
d Modus of mediaan, vanwege de uitschieter (een meetfout). 


a kwalitatief 
b kwantitatief 
c kwalitatief 
d kwantitatief 
e kwalitatief 


@ a De variabele “aantal dagen waarop in de afgelopen week meer dan 30 km met de auto is gereden’. 


Deze variabele is kwantitatief. 
b Detotale frequentieis 2 +4H6AFSH4H4H3H2=30, 
2:0+4:1+6-2+5-3 44-44: 5H3:6H2-7 99 
30 30 


gemiddelde 3.3 


modus = 2 
15° getal + 16° getal 3 +3 
2 2 

e Van klein naar groot: modus, mediaan, gemiddelde. 
d De totale frequentie is nu 30 + 4 = 34, 

3,5 keer per week geeft dus totaal 34: 3,5 = 119 keer. Het totaal was 99 keer. 

De 4 huishoudens reden dus 119 — 99 = 20 keer meer dan 30 km met de auto. 

Het vierde huishouden heeft dus op 20 — 3-6 = 2 dagen meer dan 30 km met de auto gereden. 


mediaan = 3 


@ De totale frequentie is 4+7 +11 +15 +5 +8= 50. 

De laagst mogelijke uitkomst krijgt je door te rekenen met de linkergrenzen, dat geeft 
4-50+7:55+11-60+415-65+5-70 +8-75 
30 = 634 kg. 
De hoogst mogelijke uitkomst krijg je door te rekenen met de rechtergrenzen, dat geeft 
4-55 +7-60+ 11-65 + 15-70 45-75 + 8-80 

50 =68,4 kg. 

Het gewicht 64,1 kg ligt tussen deze uitkomsten en kan dus kloppen. 


gemiddelde = 


gemiddelde = 


Bladzijde 26 
@ a discreet 

b continu 
continu 
discreet 
continu 
discreet 


mn 0D A CG 


(24) a Discrete variabele, omdat prijzen in supermarkten op centen worden afgerond. 
b De totale frequentie is 26 + 15 +23 +8 + 13 +2 =87. 
Door klassenmiddens te gebruiken, krijg je 
mende 26-50 + 15-150 + BD 8-350 + 13-450 +2: 550 widest 


e De mediaan is het middelste waarnemingsgetal. Bij 87 waarnemingsgetallen is dit de 44° meting. 


26 + 15 = 41, dus de mediaan ligt in de klasse 200 —< 300 en het is het derde getal in deze klasse. 


mediaan = 200 + 5 100 =213 cent 


d De modale klasse is de klasse 0 —< 100, want die klasse heeft de grootste frequentie. 
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(25) a Omdat de leeftijd in jaren is gemeten, gaat het hier om een discrete variabele. 
b De totale frequentie is 18 +3 +40 +9 = 70. 
Het kleinst mogelijke gemiddelde krijg je door te rekenen met de laagst mogelijke leeftijd per klasse, 
18-25 4+3-35 +40:45 +9: 55 
70 
Het grootst mogelijke gemiddelde krijg je door te rekenen met de hoogst mogelijke leeftijd per 
18-34 + 3-44 +40: 54 +0: 64 
70 
ec De mediaan is het gemiddelde van het 35° en het 36° getal. 
18+3=21 en 18 +3 +40 = 61, dus de mediaan ligt in de klasse 45 —< 55 en is het gemiddelde van 
het 14° en het 15° getal in deze klasse. 
1 


mediaan = 45 + En 10 =49 jaar 
d In de klasse 45 —< 55 vallen 10 leeftijden, namelijk 45, 46, 47, 48, 49, 50, 51, 52, 53 en 54. 
Doordat deze klasse frequentie 40 heeft komt er een leeftijd uit deze klasse minstens 4 keer voor. 


De leeftijd 36 jaar valt in de klasse 35 —< 45 met frequentie 3 en komt dus hoogstens 3 keer voor. 


dat geeft gemiddelde = =41 jaar. 


klasse, dat geeft gemiddelde = = 50 jaar. 


5.3 Spreidingsmaten 


Bladzijde 28 
(26) Bij de mediaan van de eerste groep hoort een relatieve cumulatieve frequentie van 25%. 
Bij de mediaan van de tweede groep hoort een relatieve cumulatieve frequentie van 75%. 


Bladzijde 29 
@D a Lees af: Q, = 2, mediaan = 4,7 en Q, = 6,8. 


b OUDERDOM AUTO 


CD Lees af: Q, —6,25, mediaan = 20 en Q, = 35. 
Aflezen bij 0% en 100% geeft respectievelijk O0 en 50. 


MOBIEL GEBRUIK LEERLINGEN 


0 10 20 30 40 50 60 
aantal minuten per dag 


Bladzijde 30 
(20) Voer in lijst 1 = {36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46} en lijst 2 = {6, 12, 18, 11, 6,4, 15,21, 8,3, 1}. 
1-Var Stats (TI) of 1VAR (Casio) geeft minX = 36, Q, = 38, Med = 40, Q; = 43 en maxX = 46. 


LEERLINGEN 4 VWO 


___ 


oenen 
36 37 38 39 40 41 42 43 44 45 46 
schoenmaat 


Bladzijde 31 
€D a Voer in lijst 1 = {1,2, 3,4, 5, 6, 8} en lijst 2= {3, 5, 8, 10, 8,7, 2}. 
1-Var Stats (TD) of 1 VAR (Casio) geeft x = 4,1. De mediaan is 4 en de modus is 4. 
b minX =0, Q, =3, Med=4, Q,= 5 en maxX = 8. 
TE LAAT IN DE LES OP DONDERDAG 17 SEPTEMBER 


0 1 2 3 4 5 6 7 8 9 
aantal minuten 
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©) a Voer in lijst 1 = {1, 2,3, 4, 5, 6} en lijst 2 = {7, 19, 10, 12, 4, 1}. 
1-Var Stats (TI) of VAR (Casio) geeft x = 2,8. De mediaan is 3 en modus is 2. 
b minX= 1, Q, =2, Med =3, Q} = 4 en maxX =6. 


OMVANG HUISHOUDEN 


aantal personen 


(32) a Gemeente West Maas en Waal ligt op Q,. Boven OQ, ligt nog 75% van de gemeenten. 
Dat zijn dus 0,75: 56 = 42 gemeenten met meer inwoners dan West Maas en Waal. 


b Bij elk deel van de boxplot hoort 25% van de gemeenten. Dat zijn 0,25 - 56 = 14 gemeenten. 


Uit het 3° deel ligt toog = È deel rechts van 30000. 


Dus 3 * 14 + 14 = 25 gemeenten met meer dan 30 000 inwoners. 


2000 


c_Van het 2° deel ligt s0og = 5 deel links van 20000. Dus 3-14 + 14 =17 gemeenten. 


d Als schatting voor het gemiddelde aantal inwoners van een gemeente in een deel gebruiken 


we voor elk deel het gemiddelde van de linker- en rechtergrens. 


2 + 
Dat geeft SEON AEOS, 14 + EES 14 = 784000 inwoners. 


2 2 
1500 + 18000 


e Gemiddelde aantal inwoners eerste deel is = 9750. 


2 
In totaal zijn dit dus 14+ 9750 = 136 500 inwoners. 
…_ 136500 EN 
Dus het gevraagde percentage is 1960 000 x 100% = 7,0%. 


Bladzijde 32 
CD a De mediaan is bij elke klas 3 km. 
b Nee, de boxplots zijn duidelijk verschillend maar de medianen zijn gelijk. 


ce De middelste 50% afstanden liggen in klas 4B dichter bij de mediaan dan in klas 4A. 


d De spreiding is het grootst in klas 4A, 
De spreiding is het kleinst in klas 4C. 


Bladzijde 33 
a De spreidingsbreedte is bij alle drie de leerlingen 70 — 30 = 40. 
b Bij 4 is de kwartielafstand 44 — 35 = 9 
Bij B is de kwartielafstand 43 — 37 = 6. 
Bij Cis de kwartielafstand 55 — 32 = 23. 
e Bij Cis de spreiding het grootst omdat de kwartielafstand het grootst is. 
d De spreidingsbreedte verandert, deze wordt 80 — 30 = 50. 
De kwartielafstand blijft 9, 
e De spreidingsbreedte is gevoelig voor uitschieters. 


€B Eerst 4V-C, dan 4V-A en als laatste 4V-B. 


Bladzijde 34 

€D Voer in lijst 1 ={1, 2,3, 4,5, 6,7, 8} en lijst 2 = {4, 15, 19, 28, 25, 9, 4, 2}. 
1-Var Stats (TI) of 1VAR (Casio) geeft x = 4,0 personen per huishouden 
en o = 1,5 personen per huishouden. 


(37) Voer in lijst 1 = {745,712, 699, 701, 710, 690, 758, 763, 705, 741}. 
1-Var Stats (TI) of 1VAR (Casio) geeft x = 722 cm en o= 25 cm. 


Bladzijde 35 
(38) Voer in lijst 1 = {150, 160, 170, 180} en lijst 2 = {19, 186, 244, 51}. 
1-Var Stats (TI) of 1IVAR (Casio) geeft x = 167 cm en 0 =7 cm. 
(39) a Het meest waarschijnlijk is 8 cm. 


b Het meest waarschijnlijk is 1,8. 
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(40) a De totale frequentie is 2 +4 +10 +18+12+3+1=50. 

De mediaan is het gemiddelde van het 25° en het 26° getal, dus de mediaan is 8. 
Q, is het middelste van de cerste 25 getallen, dus het 13° getal en dat is 7. 
OQ, is het middelste van de tweede 25 getallen, dus het 37° getal en dat is 9. 
Dus de kwartielafstand is 9 —7 = 2, 
Het kleinste waarnemingsgetal is 5 en het grootste waarnemingsgetal is 11, dus de 
spreidingsbreedte is 11 — 5 =6. 

b Voer in lijst 1 = {5, 6,7, 8,9, 10, 11} en lijst 2= {2, 4, 10, 18, 12,3, 1}. 
1-Var Stats (TD of 1VAR (Casio) geeft x = 7,94 en o= 1,24, 

e Een schatting van de mediaan is 6, van het gemiddelde is 6,5 en van de standaardafwijking is 1,5. 


B.4 Onderzoeken en presenteren 


Bladzijde 37 
(41) a Er hebben te weinig mensen meegedaan aan het onderzoek en er wordt een conclusie getrokken 
uit de geringe deelname aan de enquête. 


Bladzijde 38 
a hd 
b Bij vraag 1: aantal uren besteed aan huiswerk en aantal uren besteed aan bijbaan. 
Bij vraag 2: aantal uren huiswerk bovenbouw leerlingen en aantal uren huiswerk onderbouwleerlingen. 
Bij vraag 3: aantal uren tv kijken. 
Bij vraag 4: aantal uren sporten meisjes en aantal uren sporten jongens. 
EJ 


® Bijvoorbeeld 
1 Bestaat er een verschil tussen jongens en meisjes in de profielen die zij kiezen? 
2 In welke mate is de keuze bepaald door de keuze van vrienden? 
3 Iser rekening gehouden met het advies van de mentor? 
4 Bestaat er een verband tussen de eindcijfers van de exacte vakken in de 3° klas en de gekozen 
profielen? 
Hierbij horen bijvoorbeeld de variabelen 
1 geslacht (m/v) 
2 invloed vrienden (1/2/3/4/5) 
3 advies mentor (CM/EM/NG/NT) 
4 eindcijfer natuurkunde (1 - 10) 


a Leerlingen uit de examenklassen. 

b Alle weekbladen. 

c Kopers van weekbladen in een grote kiosk. 
d Hooikoortspatiënten. 


(B Ook mensen die niet in Haren wonen kunnen de poll invullen. 
Alleen mensen die facebook gebruiken kunnen de poll invullen. 


Bladzijde 40 
(46) a Er zijn grote groepen mensen die zelden of nooit op zaterdagmiddag in de stad (kunnen) rondlopen. 

Deze mensen hebben weinig of geen kans om in de steekproef voor te komen. 

b Wie geen auto heeft of zelden in de ochtendspits in de file zit, heeft weinig kans op in de steekproef 
voor te komen. 

e De steekproef van 12 personen is te klein en niet aselect: iemand in Drenthe heeft meer kans dan 
iemand in Zuid-Holland om in de steekproef voor te komen. 

d De bezoekers van een natuurgebied vormen — zeker als het gaat over het milieuprobleem — geen 
goede afspiegeling van de hele bevolking. 


Er wordt aangestuurd op een wenselijk antwoord. 
Suggestieve vraag die bovendien nodeloos ingewikkeld is. 
Wat is ‘veel’? Onduidelijke vraag. 

Niet alle antwoordmogelijkheden zijn opgenomen. 


LK CE 
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® a Ervaart u overlast van buren? 
TI nooit II soms III regelmatig IV vaak 
b Vindt u het verstandiger om een huis te kopen of te huren? 
Il huren HI kopen 
c Hoeveel uren heeft u gisteren tv gekeken? 
[Ototluur Il ltot2uur II 2tot3uur IV 3tot5uur V Suurof meer 
d Op hoeveel dagen heeft u vorige week de website Nu.nl bezocht? 
lopOdagen Il oplof2dagen III op3of4dagen IV op 5 of meer dagen 


® a Bijvoorbeeld 

1 Hoeveel uur per week besteed je aan een bijbaan/bijbanen? 
IT 1tot3uur II 3tot5uur III meerdan 5 uur 

2 In welke klas zit je? 

3 Hoeveel uur per week besteed je aan sporten buiten schooltijd om? 
I ltot3uur II 3tot5uur II meer dan 5 uur 

4 Wat is je geslacht? 
1 man [IT vrouw 


S 
D a Percentage niet eenzaam is 5 5 ri 100% = 58%. 
b Percentage zeer ernstig eenzame mannen is Pr x 100% = 1,8%. 
Percentage zeer ernstig eenzame vrouwen is oa x 100% = 2,2%. 


c kwalitatief 
kwalitatief 
d Daar is wel sprake van een rangschikking. De volgorde is dus wel van belang. 


Bladzijde 42 

(51) a interval e nominaal 
b nominaal f nominaal 
c_ ratio g ratio 
d ordinaal h ratio 


@® a Bij nominaal en ordinaal met een kwalitatieve variabele. 
Bij interval en ratio met een kwantitatieve variabele. 
b Bij interval- en rationiveau. 


® nominaal: bestemming 
ordinaal: aantal sterren van het hotel 
interval: gemiddelde jaartemperatuur op plaats van bestemming 
ratio: kosten van de reis 


(54) a Het gewicht van de zwaarste jongen is 75 kg. 
Het gewicht van het lichtste meisje is 45 kg. 
b Het verschil van het hoogste en laagste gewicht bij de jongens is 24 kg. 
e Het gewicht 53 kg komt het meeste voor bij de meisjes. De modus is dus 53 kg. 


Bladzijde 44 
® a Lees af 194 cm. 
Nee, de zwaarste jongen is 192 cm. 
b De spreidingsbreedte is 194 — 160 = 34 cm. 
e De modus is 165 cm (komt 3 keer voor). 
mediaan = lengte 13° jongen = 176 cm 
d Voer in lijst 1 = {160, 165, 165, 165, 166, 168, 169, 170, 170, … „192, 194}. 
1-Var Stats (TD) of IVAR (Casio) geeft x = 176 cm en o =9 cm. 
e 1-Var Stats (TI) of IVAR (Casio) geelt Q, = 168,5 cm, mediaan = 176 cm en Q; = 182,5 cm. 


LENGTE VAN 25 JONGENS 
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(56) a GEWICHT EN LENGTE MEISJES 
gewicht in kg 
72 


146 148 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 
lengte in em 


b Voer in lijst 1 = {61, 53, 57, … , 51, 55}. 
1-Var Stats (TD) of 1 VAR (Casio) geeft x = 57 kg en o=7 kg. 


Bladzijde 45 
(57) a De hoogst gemeten waarde is 22 °C en de bijbehorende waarde volgens het model is 17 °C, 
b De gemeten waarde is -3 °C en de waarde volgens het model is 3 °C. 
ec spreidingsbreedte gemeten = 22 —-7 = 29 
spreidingsbreedte model = 18 —-3 =21 


2921 100% = 38,1%. 


Het scheelt 


d Ja, de puntenwolk ligt redelijk dicht bij de lijn G = M. 
e Ja, de gemeten waarden beginnen te laag, doordat b=-1,334. Verdere schattingen zijn ook te laag, 
doordat de richtingscoëfficiënt minder dan 1 is. 


Bladzijde 46 
j : 120 EE! 
D l == 0,012 teek == 0,016. 
(58) e populatieproportie p [0000 0,012 en de steekproefproportie p 250 0, 
(59) Je weet pj a = 0,418 en er zijn 627 mensen met bloedgroep A. Dus 0,418 = _ 
hen ’ k aantal patiënten 
Hieruit volgt aantal patiënten = ns = 1500. 
Je weet Prjoedgroep A — 0,45 en er zijn 27 patiënten met bloedgroep A in de steekproef. 
Dus 0,45 = 2 ' 
grootte steekproef 
Hieruit volgt grootte steekproef = EEn = 60. 
Het aantal patiënten in de steekproef was dus 60. 
Bladzijde 47 
@ a 31 leerlingen van een schoolklas is geen representatieve steekproef voor de hele Nederlandse jeugd. 
b In een nieuwbouwwijk wonen vaak andere mensen (jonger, meer welgesteld) dan in een oude stadskern. 
ec Wat voor vlekken is bekeken? Andere wasmiddelen verdrijven wellicht 99% van dezelfde vlekken. 
d Er staat niet bij hoeveel en welke andere middelen er getest zijn. 
e Het is interessanter om te weten hoe de regenval over een jaar is gespreid. 
f_De artsen kunnen de brillen cadeau gekregen hebben, of ze hebben een andere reden (mode, status) om 


de brillen te bezitten. 
g De levensduur van een fietsband hangt niet af van de gebruikte fietspomp. 
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@ a Uit tabel 1 zou je kunnen concluderen dat mannen meer kans hebben de ziekte op te lopen dan vrouwen. 
b Uit tabel II blijkt dat 50% van de rokers en slechts 10% van de niet-rokers de ziekte heeft opgelopen, 
onafhankelijk van het geslacht. Niet het geslacht maar het roken is van invloed. 


@ a Geen causaal verband. Aan voorwaarde 2 (de tijd) is niet voldaan. 
b Wel een causaal verband. 
e Geen causaal verband. Aan voorwaarde 3 is niet voldaan. Bij een grote brand zijn meer 
brandweerlieden aanwezig, maar die veroorzaken de grote brand niet, 
d Wel een causaal verband. 
e Geen causaal verband. Aan voorwaarde 3 is niet voldaan. In een straat met veel BMW’s zijn veel 
rijke gezinnen en die verbruiken wellicht meer energie. 


Bladzijde 48 

® Dat kan hij niet concluderen. Mensen die vlees eten hebben wellicht een andere levensstijl dan vegetariërs. 
De enige conclusie uit het artikel kan zijn dat mensen met een hoge bloeddruk wellicht baat hebben bij een 
vegetarisch dieet. 


@ Dat kan ze niet concluderen. Depressieve mensen besteden wellicht minder aandacht aan de 
persoonlijke verzorging, dus misschien is het juist wel omgekeerd, dus dat depressiviteit een slecht 
gebit veroorzaakt. 

5.5 Grafische verwerking met Excel 
Bladzijde 50 
@® 


b * 


Bladzijde 51 


®* 
(67 Ed 


® Voorbeelden van een lijndiagram, staafdiagram, cirkeldiagram en stapeldiagram: 


TOTAAL AANTAL EERSTEJAARS WO-STUDENTEN 


aantal TOEGANGSDIPLOMA'S EERSTEJAARSSTUDENTEN WO 
m aantal 
| 
| & Vwo-diploma 
{| Mm Hbo-propedeuse 
|| @ Hbo-diploma 
|| overig 
Kl $ © # $ ® ® , 
schooljaar 
VERDELING EERSTEJAARS WO-STUDENTEN 
NAAR TOEGANGSDIPLOMA 201 2-201 3 TOEGANGSDIPLOMA'S EERSTEJAARS WO-STUDENTEN 
ercentage 
100% E 
50% Mi 
80% 
70% B overig 
e Vwo-diploma se 1 & Hbo-diploma 
q 
| : 
« Hbo-propedeuse gn Ï ® Hbo-propedeuse 
| B Vwo-diploma 
» Hbo-diploma 20% Ï 
10% Ï 
« overig 0% 


schooljaar 
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Bladzijde 52 
@ Voor de kwantitatieve gegevens geeft Excel de onderstaande waarden. 


DN € | 5 aan: 

1 gewicht in kg aantal keer sporten per week zakgeld per maand ineuro's afstand huis-schaolinkm _gezinsomvang 

2 gemiddelde 62,7 2,1 16,60 10,1 4 

3 |standaardafwijking 9,7 1,7 6,80 7,0 1,3 

A [kleinste 46,1 0,0 6,00 1,0 2 

5 A1 57,0 0,8 11,50 4,8 3 

6 | mediaan 61,1 2,0 16,50 8,0 â 

Q3 69,1 3,3 20,50 14,3 5 

8 |grootste 81,2 5,0 32,00 24,0 7 
OA A [ 5 C Dan E a 

1 ondergrens bovengrens klasse klassenmidden frequentie icum. freq rel. cum. freq. 

2 30 40 30 -< 40 35 0 0 0,0% 

Sil 40 50 40 -< 50 45 3 3 10,7% 

4 | 50 60 50 -< 60 55 11 14 50,0% 

5 60 70 60 -< 70 65 7 21 75,0% 

6 70 80 70 -< 80 75 5 26 92,9% 

7 80 90 80 -< 90 85 2 28 100,0% 

8 90 100 90 -< 100 95 0 28 100,0% 
@ a 

b * 
klasse rel fre GEWICHT LEERLINGEN 
q relatieve frequentie 
30 -< 40 0,0% 45% 
40 -< 50 10,7% hans 


50 -< 60 39,3% 
60 -< 70 25,0% 


25% 
70 -< 80 17,9% 20% 
80 -< 90 7,1% 15% 
90 -< 100 0,0% 10% mj 
5% 
— ene 


30 —< 40 40 —< 50 50 —< 60 60 -< 70 70 —< 80 80-<90 90 -<100 


kg 
Bladzijde 53 
| A B AANTAL KEER SPORTEN PER WEEK 
1 \aantalkeersportenperweek frequentie È frequentie 
2 0 
3 0 7 8 
4 ï 5 8 
5 2 5 e 
6 3 A 4 
7 4 3 3 
8 5 4 2 
9 0 1 
0 
1 2 3 4 5 6 RÀ asl 
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@® Excel geeft als formule voor de bestpassende lijn y= 1,0904x + 7,2177 (zie onderstaande figuur). 
Bij de laagst gemeten temperatuur 18°C hoort x= 18. 
De bijbehorende hoogst gemeten temperatuur is y — 1,0904: 18 + 7,2177 = 27 °C. 


TEMPERATUURGEGEVENS ROTTERDAM 2013 


hoogst gemeten temperatuur (°C) 
40,0 


‚ 
Loo Suf ® 
2% dels vr 
A 


—20,0 1508 "1009, 


Diagnostische toets 


Bladzijde 54 
@ a PAKKEN MET TELAAG GEWICHT 
frequentie 


hd 


hd ° 


35,0 
* 
Sb hd 
30,0 
25,0 nn Een y=1.0904X + 7.2177 
8 o 

20,0 ek 

, ; & EN 

„5 
BCN 
15,0 
AS 
& 
Kad 
o 5,0 10,0 15,0 20,0 25,0 


laagst gemeten temperatuur (°C) 


aantal 
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Cc PAKKEN MET TE WEINIG GEWICHT 
relatieve frequentie 


30 


25 


20 


15 


10 


aantal 


d Erzijn 45 « 20 = 900 pakken gecontroleerd. 
Hiervan hadden 1-10+2:7+3-6+4:4+5:3=73 te weinig gewicht. 


Datis x 100% = 8,1%. 


zuurstofgehalte 
17,5 —< 18,5 
18,5 —< 19,5 
19,5 —< 20,5 
20,5 —< 21,5 
21,5 22,5 


frequentie | rel. freq. 


b ZUURSTOFGEHALTE 


relatieve frequentie 


17,5 18,5 19,5 20,5 21,5 22,5 
volumeprocenten 
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€ _ ZUURSTOFGEHALTE 


frequentie 


17,5 18,5 19,5 20,5 21,5 22,5 
volumeprocenten 


d De relatieve cumulatieve frequenties zijn 30%, 50%, 75%, 90%, 100%. 
ZUURSTOFGEHALTE 
rel. eum. frequentie 


100 ] 
80 


60 


40 


20 


‚5 18,5 19,5 20,5 21,5 22,5 
volumeprocenten 


® 2 Serie is een kwalitatieve variabele. 
Exemplaren verkocht is een kwantitatieve variabele. 
Gemiddelde waardering is een kwalitatieve variabele. 
b Een kwalitatieve variabele kan niet worden gemiddeld. 


Als we al een gemiddelde zouden willen bepalen, dan zouden we moeten weten hoeveel stemmen er op 


elke game zijn uitgebracht. 
c Bijvoorbeeld de variabele ‘geschikt vanaf leeftijd’. Deze variabele is discreet. 
Of bijvoorbeeld “gemiddelde speelduur’. Deze variabele is continu. 
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Bladzijde 55 


@ « 


Voer in lijst 1 = {2, 3,4, 5,6, 7,8, 10, 15} en lijst 2= {4, 6, 10, 18, 4, 4, 2,3, 1}. 

1-Var Stats (TI) of 1VAR (Casio) geeft x = 5,2 en o = 2,3. 

Dus het gemiddelde is 5,2 uitrukken per week en standaardafwijking is 2,3 uitrukken per week. 
1-Var Stats (TI) of VAR (Casio) geeft minX = 2, Q, =4, Med= 5, Q, =6 en maxX = 15. 
UITRUKKEN BRANDWEER 


EN 


pmen orn vensters nd 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
aantal per week 


spreidingsbreedte= 15 — 2 =13 

kwartielafstand = 6 —4=2 

Er is een uitschieter aan de rechterkant. Dat kun je zien aan het lange lijnstuk van Q; tot maxX. 
Deze uitschieter zorgt ervoor dat het gemiddelde hoger is dan de mediaan. 


1 In de ochtend hebben mensen minder trek in ice tea. 
2 Als het warm is hebben meer mensen trek in ice tea. 


3 Alleen leerlingen uit de onderbouw worden ondervraagd. Dit is niet de een afspiegeling van de 


doelgroep. 


Omdat het een warme zomerdag is, zullen jongeren die op het strand zijn de smaken misschien meer 


waarderen. 


Nee, alleen bij de de nieuwe smaken was de zoetste het meest populair. Of dat ook geldt voor alle smaken 


is onbekend. Bovendien kunnen andere factoren dan de zoetheid doorslaggevend zijn geweest. 


aantal jaren ouder dan vijftig: ratio 

opleidingsniveau: ordinaal 

hobby’s: nominaal 

aantal keer sporten per week: ratio 

aantal jaren ouder dan vijftig: gemiddelde of mediaan 
opleidingsniveau: mediaan of modus 

hobby’s: modus 

aantal keer sporten per week: gemiddelde of mediaan 


Voer in lijst 1 = {8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 24} en 
lijst 2={2,2,2,3,8,3,3,3, 1, 1, 1, 1. 
1-Var Stats (TI) of 1VAR (Casio) geeft x = 12,8 en mediaan = 12, 


b De onderste boxplot, omdat hierbij de spreiding het kleinst is. 
Wiebe kan het beste een spreidingsdiagram gebruiken met de lengte van de voornaam op de ene as en 


de lengte van de achternaam op de andere as. 
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